학습 을 강화 하 다 [학습 노트 강화] '술고래 집 으로' 에서 Q Learning 알고리즘 알 아 보기 1. 배경 현재 필 자 는 Q - learning 방법 을 이용 하여 술고래 가 집에 돌아 갈 수 있 도록 도와 주 는 작은 예 를 말한다. 예 를 들 어 환경 은 1 차원 세계 이 고 세계 오른쪽 에 술고래 의 집 이다.이 술 귀신 은 술 을 많이 마셔 서 집 으로 돌아 가 는 길 을 전혀 기억 하지 못 한다. 단지 자신의 직감 에 따라 왼쪽으로 가다가 오른쪽으로 간다.술 귀신 은 결국 집... 학습 을 강화 하 다
[학습 노트 강화] '술고래 집 으로' 에서 Q Learning 알고리즘 알 아 보기 1. 배경 현재 필 자 는 Q - learning 방법 을 이용 하여 술고래 가 집에 돌아 갈 수 있 도록 도와 주 는 작은 예 를 말한다. 예 를 들 어 환경 은 1 차원 세계 이 고 세계 오른쪽 에 술고래 의 집 이다.이 술 귀신 은 술 을 많이 마셔 서 집 으로 돌아 가 는 길 을 전혀 기억 하지 못 한다. 단지 자신의 직감 에 따라 왼쪽으로 가다가 오른쪽으로 간다.술 귀신 은 결국 집... 학습 을 강화 하 다